二值选择模型(2):Probit与Logit
对于二值选择模型:
当连接函数p(x)为标准正态的累计分布函数Φ(x)时,模型被称为Probit:
当连接函数p(x)为logistic分布的累计分布函数时,模型被称为Logit:
由于Probit与Logit模型本质上属于非线性模型,通常采用最大似然估计法(MLE)进行估计。在满足独立同分布(i.i.d.)假设和已知分布函数的情况下,最大似然估计是最佳无偏估计(BUE,比线性模型的BLUE少个L)。
通过MLE得到模型参数的估计值后,接下来的重要工作便是对参数的经济解释。在线性模型的情况下,回归系数
但是对于本质是非线性模型的Probit与Logit,其估计量
可以发现,Probit的真正的边际效应为
在实际运用中,有三种常用的边际效应:
1)平均边际效应。即先分别计算在每个样本观测值上的边际效应,然后进行简单算术平均得到最终的边际效应。这种边际效应也是Stata默认计算的边际效应。
2)样本均值处的边际效应。
3)在某代表值处的边际效应。
小结:Probit模型等的估计参数并不具备经济意义,不能直接进行解释,需要先转换为平均边际效应。这也是看文献时,回归表格的注释里都有“表中报告的是估计的边际效应”这样一句话的原因。
附:
一般来说,在得到一组回归参数的估计值后,往往会从拟合优度的角度对模型的拟合情况给出一个评价。对于常规的线性模型,判定系数
关于不必过多关注R square的原因,可回顾R square,真的很重要吗?这一篇推文。